在干扰中爆发之前的火山骚乱早期迹象的检测,干涉性合成孔径雷达(Insar)数据中的地面变形形式对评估火山危害至关重要。在这项工作中,我们将其视为INSAR图像的二进制分类问题,提出了一种新的深度学习方法,该方法利用综合产生的干扰图的丰富来源,以培训在真正干扰图中同样好的质量分类器。问题的不平衡性质,较少的正样品的秩序,与缺乏具有标有标记的insar数据的策划数据库,为传统的深度学习架构设置了一个具有挑战性的任务。我们提出了一个新的域适应框架,其中我们从使用视觉变压器中学习来自合成数据的类原型。我们报告了检测精度,超越了对火山骚扰检测的最新技术。此外,我们通过学习学习的表示和原型空间之间的新的非线性投影来建立了这些知识,使用我们的模型从未标记的真实insar数据集产生的伪标签。这导致新技术在我们的测试集上以97.1%的价格为97.1%。我们通过在未标记的Real Insar DataSet上培训简单的Reset-18卷积神经网络,展示了我们的方法的稳健性,其中来自我们顶部变换器 - 原型模型生成的伪标签。我们的方法在没有手动标记任何样本的情况下,在不需要手动标记任何样本的情况下,提供了显着的改进,以便在各种遥感应用中进一步开发合成符号数据的道路。
translated by 谷歌翻译
In contrast to the rapid digitalization of several industries, agriculture suffers from low adoption of smart farming tools. While AI-driven digital agriculture tools can offer high-performing predictive functionalities, they lack tangible quantitative evidence on their benefits to the farmers. Field experiments can derive such evidence, but are often costly, time consuming and hence limited in scope and scale of application. To this end, we propose an observational causal inference framework for the empirical evaluation of the impact of digital tools on target farm performance indicators (e.g., yield in this case). This way, we can increase farmers' trust via enhancing the transparency of the digital agriculture market and accelerate the adoption of technologies that aim to secure farmer income resilience and global agricultural sustainability. As a case study, we designed and implemented a recommendation system for the optimal sowing time of cotton based on numerical weather predictions, which was used by a farmers' cooperative during the growing season of 2021. We then leverage agricultural knowledge, collected yield data, and environmental information to develop a causal graph of the farm system. Using the back-door criterion, we identify the impact of sowing recommendations on the yield and subsequently estimate it using linear regression, matching, inverse propensity score weighting and meta-learners. The results reveal that a field sown according to our recommendations exhibited a statistically significant yield increase that ranged from 12% to 17%, depending on the method. The effect estimates were robust, as indicated by the agreement among the estimation methods and four successful refutation tests. We argue that this approach can be implemented for decision support systems of other fields, extending their evaluation beyond a performance assessment of internal functionalities.
translated by 谷歌翻译
In contrast to the rapid digitalization of several industries, agriculture suffers from low adoption of climate-smart farming tools. Even though AI-driven digital agriculture can offer high-performing predictive functionalities, it lacks tangible quantitative evidence on its benefits to the farmers. Field experiments can derive such evidence, but are often costly and time consuming. To this end, we propose an observational causal inference framework for the empirical evaluation of the impact of digital tools on target farm performance indicators. This way, we can increase farmers' trust by enhancing the transparency of the digital agriculture market, and in turn accelerate the adoption of technologies that aim to increase productivity and secure a sustainable and resilient agriculture against a changing climate. As a case study, we perform an empirical evaluation of a recommendation system for optimal cotton sowing, which was used by a farmers' cooperative during the growing season of 2021. We leverage agricultural knowledge to develop a causal graph of the farm system, we use the back-door criterion to identify the impact of recommendations on the yield and subsequently estimate it using several methods on observational data. The results show that a field sown according to our recommendations enjoyed a significant increase in yield (12% to 17%).
translated by 谷歌翻译
变形金刚在NLP中广泛使用,它们始终如一地实现最先进的性能。这是由于他们基于注意力的架构,这使他们能够对单词之间的丰富语言关系进行建模。但是,变压器很难解释。能够为其决策提供推理是人类生命受影响的领域(例如仇恨言论检测和生物医学)的模型的重要特性。随着变压器在这些领域中发现广泛使用,因此需要为其量身定制的可解释性技术。在这项工作中研究了基于注意力的可解释性技术对文本分类中的有效性。尽管担心文献中的基于注意力的解释,但我们表明,通过适当的设置,可以将注意力用于此类任务,结果与最先进的技术相当,同时也更快,更友好。我们通过采用新功能重要性指标的一系列实验来验证我们的主张。
translated by 谷歌翻译
流媒体数据中对异常的实时检测正在受到越来越多的关注,因为它使我们能够提高警报,预测故障并检测到整个行业的入侵或威胁。然而,很少有人注意比较流媒体数据(即在线算法)的异常检测器的有效性和效率。在本文中,我们介绍了来自不同算法家族(即基于距离,密度,树木或投影)的主要在线检测器的定性合成概述,并突出了其构建,更新和测试检测模型的主要思想。然后,我们对在线检测算法的定量实验评估以及其离线对应物进行了彻底的分析。检测器的行为与不同数据集(即元功能)的特征相关,从而提供了对其性能的元级分析。我们的研究介绍了文献中几个缺失的见解,例如(a)检测器对随机分类器的可靠性以及什么数据集特性使它们随机执行; (b)在线探测器在何种程度上近似离线同行的性能; (c)哪种绘制检测器的策略和更新原始图最适合检测仅在数据集的功能子空间中可见的异常; (d)属于不同算法家族的探测器的有效性与效率之间的权衡是什么; (e)数据集的哪些特定特征产生在线算法以胜过所有其他特征。
translated by 谷歌翻译
本文对地面农业机器人系统和应用进行了全面综述,并特别关注收获,涵盖研究,商业产品和结果及其能力技术。大多数文献涉及作物检测的发展,通过视觉及其相关挑战的现场导航。健康监测,产量估计,水状态检查,种子种植和清除杂草经常遇到任务。关于机器人收割,苹果,草莓,西红柿和甜辣椒,主要是出版物,研究项目和商业产品中考虑的农作物。据报道的收获农业解决方案,通常由移动平台,单个机器人手臂/操纵器和各种导航/视觉系统组成。本文回顾了报告的特定功能和硬件的发展,通常是运营农业机器人收割机所要求的;它们包括(a)视觉系统,(b)运动计划/导航方法(对于机器人平台和/或ARM),(c)具有3D可视化的人类机器人交流(HRI)策略,(d)系统操作计划&掌握策略和(e)机器人最终效果/抓手设计。显然,自动化农业,特别是通过机器人系统的自主收获是一个研究领域,它仍然敞开着,在可以做出新的贡献的地方提供了一些挑战。
translated by 谷歌翻译
在文化遗产中,高光谱图像通常使用,因为它们提供了有关材料光学特性的扩展信息。因此,从要应用的机器学习技术的角度来看,这种高维数据的处理变得具有挑战性。在本文中,我们提出了一种基于排名的基于张量的学习模型,以识别和对文化遗产纪念碑的物质缺陷进行分类。与常规的深度学习方法相反,拟议的高阶基于张量的学习表明,具有更高的准确性和鲁棒性,以防止过度拟合。来自联合国教科文组织保护区的现实世界数据的实验结果表明,与常规深度学习模型相比,该计划的优越性。
translated by 谷歌翻译
多标签分类是一项具有挑战性的任务,尤其是在要预测的标签数量很大的域中。深度神经网络通常在图像和文本数据的多标签分类方面有效。但是,在处理表格数据时,传统的机器学习算法(例如树形合奏)似乎超过了竞争。随机森林是一种流行的合奏算法,在各种现实世界中发现了使用。此类问题包括金融领域的欺诈检测,法律部门的犯罪热点检测以及生物医学领域,当患者记录可访问时疾病概率预测。由于它们对人们的生活有影响,因此这些领域通常需要可以解释决策系统。随机森林缺乏该特性,尤其是当使用大量树预测变量时。该问题在最近的一项名为Lionforests的研究中解决了有关单标签分类和回归。在这项工作中,我们通过对解释所涵盖的标签采用三种不同的策略来使该技术适应多标签分类问题。最后,我们提供了一组定性和定量实验,以评估该方法的功效。
translated by 谷歌翻译
哥内克人Sentinel Imagery的纯粹卷的可用性为使用深度学习的大尺度创造了新的土地利用陆地覆盖(Lulc)映射的机会。虽然在这种大型数据集上培训是一个非琐碎的任务。在这项工作中,我们试验Lulc Image分类和基准不同最先进模型的Bigearthnet数据集,包括卷积神经网络,多层感知,视觉变压器,高效导通和宽残余网络(WRN)架构。我们的目标是利用分类准确性,培训时间和推理率。我们提出了一种基于用于网络深度,宽度和输入数据分辨率的WRNS复合缩放的高效导通的框架,以有效地训练和测试不同的模型设置。我们设计一种新颖的缩放WRN架构,增强了有效的通道注意力机制。我们提出的轻量级模型具有较小的培训参数,实现所有19个LULC类的平均F分类准确度达到4.5%,并且验证了我们使用的resnet50最先进的模型速度快两倍作为基线。我们提供超过50种培训的型号,以及我们在多个GPU节点上分布式培训的代码。
translated by 谷歌翻译
语言模型是所有现代自然语言处理(NLP)任务的基础。变压器架构的引入在许多NLP任务中非常有效地制作语言建模,导致该领域的显着进步。然而,变压器具有大的计算成本,这相对于输入长度逐渐增长。这提出了一个挑战,以了解长文本需要很多上下文。在本文中,我们提出了一个名为Corelm的微调框架,它扩展了当前预级语言模型的体系结构,以便它们包含显式实体信息。通过引入实体表示,我们在模型的上下文空间之外进行提供的信息,这导致更好的语言模型,用于计算成本的一小部分。我们使用GPT2实现我们的方法,并将微调模型与原件进行比较。与GPT2和GPT2的微调版本相比,我们所提出的模型在Gumby和Lambdada数据集中实现了较低的困惑,而GPT2没有任何变化。我们还在Lambada和儿童书籍测试中的准确性方面进行了比较模型的性能,而无需使用模型创建的Coreference注释。
translated by 谷歌翻译